Linux mount 学习(二)

Shared subtrees

简单点说, Shared subtrees 就是一种控制子挂载点能否在其他地方被看到的技术,它只会在 bind mountmount namespace 中用到,属于不怎么常用的功能。本篇将以 bind mount 为例对 Shared subtrees 做一个简单介绍

回想一下上一篇中介绍的bind mount部分,如果bind在一起的两个目录下的子目录再挂载了设备的话,他们之间还能相互看到子目录里挂载的内容吗? 比如在第一个目录下的子目录里面再mount了一个设备,那么在另一个目录下面能看到这个mount的设备里面的东西吗?答案是要看bind mount的propagation type。那什么是propagation type呢?

peer group和propagation type都是随着shared subtrees一起被引入的概念,下面分别对他们做一个介绍。

peer group

peer group 就是一挂载点的集合,他们之间可以共享挂载信息。

  • mount-bind使得源和目的挂载点属于同一个peer group

  • 创建新的mount namespace,新的和老的namespace里相同挂载点就会属于同一个peer group,因为新namespace会拷贝一份老namespace的挂载点信息

propagation type

这是一个标志,决定修改挂载点的时候会不会影响相同的peer group

  • MS_SHARED: 挂载信息会在同一个peer group的不同挂载点之间共享传播

  • MS_PRIVATE: 挂载信息根本就不共享,也即private的挂载点不会属于任何peer group

  • MS_SLAVE: 信息的传播是单向的,在同一个peer group里面,master的挂载点下面发生变化的时候,slave的挂载点下面也跟着变化,但反之则不然,slave下发生变化的时候不会通知master,master不会发生变化。

  • MS_UNBINDABLE: 这个和MS_PRIVATE相同,只是这种类型的挂载点不能作为bind mount的源,主要用来防止递归嵌套情况的出现

需要注意的地方

  • propagation type是挂载点的属性,每个挂载点都是独立的

  • 挂载点是有父子关系的,比如挂载点/和/mnt/cdrom,/mnt/cdrom都是‘/’的子挂载点,‘/’是/mnt/cdrom的父挂载点

  • 默认情况下,如果父挂载点是MS_SHARED,那么子挂载点也是MS_SHARED的,否则子挂载点将会是MS_PRIVATE,跟爷爷挂载点没有关系

实例

准备环境

1
2
3
4
5
6
7
8
9
10
11
#准备4个虚拟的disk
kingand67@kelele67:~$ mkdir disks && cd disks
kingand67@kelele67:~/disks$ dd if=/dev/zero bs=1M count=32 of=./disk1.img
32+0 records in
32+0 records out
33554432 bytes (34 MB, 32 MiB) copied, 0.0203764 s, 1.6 GB/s
kingand67@kelele67:~/disks$ dd if=/dev/zero bs=1M count=32 of=./disk2.img
kingand67@kelele67:~/disks$ dd if=/dev/zero bs=1M count=32 of=./disk3.img
kingand67@kelele67:~/disks$ dd if=/dev/zero bs=1M count=32 of=./disk4.img

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
#并在上面创建ext2文件系统,用于后续的mount测试
kingand67@kelele67:~/disks$ mkfs.ext2 ./disk1.img
mke2fs 1.42.13 (17-May-2015)
Discarding device blocks: done
Creating filesystem with 32768 1k blocks and 8192 inodes
Filesystem UUID: d34a16ed-3d87-4fa3-adeb-185ca6816a7c
Superblock backups stored on blocks:
8193, 24577
Allocating group tables: done
Writing inode tables: done
Writing superblocks and filesystem accounting information: done
kingand67@kelele67:~/disks$ mkfs.ext2 ./disk2.img
kingand67@kelele67:~/disks$ mkfs.ext2 ./disk3.img
kingand67@kelele67:~/disks$ mkfs.ext2 ./disk4.img

1
2
3
4
#准备两个目录用于挂载上面创建的disk
kingand67@kelele67:~/disks$ mkdir disk1 disk2
kingand67@kelele67:~/disks$ ls
disk1 disk1.img disk2 disk2.img disk3.img disk4.im

1
2
3
#确保根目录的propagation type是shared,
#这一步是为了保证大家的操作结果和示例中的一样
kingand67@kelele67:~/disks$ sudo mount --make-shared /

查看 propagation type 和 peer group

1
2
#显式的以shared方式挂载disk1
kingand67@kelele67:~/disks$ sudo mount --make-shared ./disk1.img ./disk1

1
2
#显式的以private方式挂载disk2
kingand67@kelele67:~/disks$ sudo mount --make-private ./disk2.img ./disk2

1
2
3
4
5
6
7
#mountinfo比mounts文件包含有更多的关于挂载点的信息
#这里sed主要用来过滤掉跟当前主题无关的信息
#shared:111表示挂载点/home/dev/disks/disk1是以shared方式挂载,且peer group id为111
#而挂载点/home/dev/disks/disk2没有相关信息,表示是以private方式挂载
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |grep disk | sed 's/-.*//'
150 22 7:0 / /home/kingand67/disks/disk1 rw,relatime shared:111
156 22 7:1 / /home/kingand67/disks/disk2 rw,relatime

1
2
3
4
#分别在disk1和disk2目录下创建目录disk3和disk4,然后挂载disk3,disk4到这两个目录
kingand67@kelele67:~/disks$ sudo mkdir ./disk1/disk3 ./disk2/disk4
kingand67@kelele67:~/disks$ sudo mount ./disk3.img ./disk1/disk3
kingand67@kelele67:~/disks$ sudo mount ./disk4.img ./disk2/disk4

1
2
3
4
5
6
7
8
#查看挂载信息,第一列的数字是挂载点ID,第二例是父挂载点ID,
#从结果来看,150和162的类型都是shared,而179和173的类型都是private的,
#说明在默认mount的情况下,子挂载点会继承父挂载点的propagation type
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |grep disk | sed 's/-.*//'
150 22 7:0 / /home/kingand67/disks/disk1 rw,relatime shared:111
156 22 7:1 / /home/kingand67/disks/disk2 rw,relatime
162 150 7:2 / /home/kingand67/disks/disk1/disk3 rw,relatime shared:117
293 156 7:3 / /home/kingand67/disks/disk2/disk4 rw,relatime

shared 和 private mount

1
2
3
4
#umount掉disk3和disk4,创建两个新的目录bind1和bind2用于bind测试
kingand67@kelele67:~/disks$ sudo umount /home/kingand67/disks/disk1/disk3
kingand67@kelele67:~/disks$ sudo umount /home/kingand67/disks/disk2/disk4
kingand67@kelele67:~/disks$ mkdir bind1 bind2

1
2
3
#bind的方式挂载disk1到bind1,disk2到bind2
kingand67@kelele67:~/disks$ sudo mount --bind ./disk1 ./bind1
kingand67@kelele67:~/disks$ sudo mount --bind ./disk2 ./bind2

1
2
3
4
5
6
7
8
9
#查看挂载信息,显然默认情况下bind1和bind2的propagation type继承自父挂载点22(/),都是shared。
#由于bind2的源挂载点disk2是private的,所以bind2没有和disk2在同一个peer group里面,
#而是重新创建了一个新的peer group,这个group里面就只有它一个。
#因为150和162都是shared类型且是通过bind方式mount在一起的,所以他们属于同一个peer group 111。
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |grep disk | sed 's/-.*//'
150 22 7:0 / /home/kingand67/disks/disk1 rw,relatime shared:111
156 22 7:1 / /home/kingand67/disks/disk2 rw,relatime
162 22 7:0 / /home/kingand67/disks/bind1 rw,relatime shared:111
168 22 7:1 / /home/kingand67/disks/bind2 rw,relatime shared:127

1
2
3
#ID为24的挂载点为根目录的挂载点
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |grep ^22| sed 's/-.*//'
22 0 8:1 / / rw,relatime shared:1

1
2
3
4
5
#这时disk3和disk4目录都是空的
kingand67@kelele67:~/disks$ ls bind1/disk3/
kingand67@kelele67:~/disks$ ls bind2/disk4/
kingand67@kelele67:~/disks$ ls disk1/disk3/
kingand67@kelele67:~/disks$ ls disk2/disk4/

1
2
3
#重新挂载disk3和disk4
kingand67@kelele67:~/disks$ sudo mount ./disk3.img ./disk1/disk3/
kingand67@kelele67:~/disks$ sudo mount ./disk4.img ./disk2/disk4/

1
2
3
4
5
6
#由于disk1/和bind1/属于同一个peer group,
#所以在挂载了disk3后,在两个目录下都能看到disk3下的内容
kingand67@kelele67:~/disks$ ls disk1/disk3/
lost+found
kingand67@kelele67:~/disks$ ls bind1/disk3/
lost+found

1
2
3
4
5
6
#而disk2/是private类型的,所以在他下面挂载disk4不会通知bind2,
#于是bind2下的disk4目录是空的
kingand67@kelele67:~/disks$ ls disk2/disk4/
lost+found
kingand67@kelele67:~/disks$ ls bind2/disk4/
kingand67@kelele67:~/disks$

1
2
3
4
5
#再看看disk3,虽然174和175的父挂载点不一样,但由于他们父挂载点属于同一个peer group,
#且disk3是以默认方式挂载的,所以他们属于同一个peer group
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |egrep "disk3"| sed 's/-.*//'
174 150 7:2 / /home/kingand67/disks/disk1/disk3 rw,relatime shared:133
175 162 7:2 / /home/kingand67/disks/bind1/disk3 rw,relatime shared:133

1
2
3
4
#umount bind1/disk3后,disk1/disk3也相应的自动umount掉了
kingand67@kelele67:~/disks$ sudo umount bind1/disk3
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo | grep disk3
kingand67@kelele67:~/disks$

slave mount

1
2
3
4
5
#umount除disk1的所有其他挂载点
kingand67@kelele67:~/disks$ sudo umount ./disk2/disk4
kingand67@kelele67:~/disks$ sudo umount /home/kingand67/disks/bind1
kingand67@kelele67:~/disks$ sudo umount /home/kingand67/disks/bind2
kingand67@kelele67:~/disks$ sudo umount /home/kingand67/disks/disk2

1
2
3
#确认只剩disk1
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |grep disk| sed 's/-.*//'
150 22 7:0 / /home/kingand67/disks/disk1 rw,relatime shared:111

1
2
3
#分别显式的用shared和slave的方式bind disk1
kingand67@kelele67:~/disks$ sudo mount --bind --make-shared ./disk1 ./bind1
kingand67@kelele67:~/disks$ sudo mount --bind --make-slave ./bind1 ./bind2

1
2
3
4
5
6
#150、156和162都属于同一个peer group,
#master:105表示/home/dev/disks/bind2是peer group 105的slave
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |grep disk| sed 's/-.*//'
150 22 7:0 / /home/kingand67/disks/disk1 rw,relatime shared:111
156 22 7:0 / /home/kingand67/disks/bind1 rw,relatime shared:111
162 22 7:0 / /home/kingand67/disks/bind2 rw,relatime master:111

1
2
#mount disk3到disk1的子目录disk3下
kingand67@kelele67:~/disks$ sudo mount ./disk3.img ./disk1/disk3/

1
2
3
4
5
6
7
8
#其他两个目录bin1和bind2里面也挂载成功,说明master发生变化的时候,slave会跟着变化
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |grep disk| sed 's/-.*//'
150 22 7:0 / /home/kingand67/disks/disk1 rw,relatime shared:111
156 22 7:0 / /home/kingand67/disks/bind1 rw,relatime shared:111
162 22 7:0 / /home/kingand67/disks/bind2 rw,relatime master:111
168 150 7:1 / /home/kingand67/disks/disk1/disk3 rw,relatime shared:127
170 162 7:1 / /home/kingand67/disks/bind2/disk3 rw,relatime master:127
169 156 7:1 / /home/kingand67/disks/bind1/disk3 rw,relatime shared:127

1
2
3
#umount disk3,然后mount disk3到bind2目录下
kingand67@kelele67:~/disks$ sudo umount ./disk1/disk3/
kingand67@kelele67:~/disks$ sudo mount ./disk3.img ./bind2/disk3/

1
2
3
4
5
6
7
#由于bind2的propagation type是slave,所以disk1和bind1两个挂载点下面不会挂载disk3
#从168的类型可以看出,当父挂载点162是slave类型时,默认情况下其子挂载点168是private类型
kingand67@kelele67:~/disks$ cat /proc/self/mountinfo |grep disk| sed 's/-.*//'
150 22 7:0 / /home/kingand67/disks/disk1 rw,relatime shared:111
156 22 7:0 / /home/kingand67/disks/bind1 rw,relatime shared:111
162 22 7:0 / /home/kingand67/disks/bind2 rw,relatime master:111
168 162 7:1 / /home/kingand67/disks/bind2/disk3 rw,relatime

总结

如果用到了 bind mountmount namespace ,在挂载设备的时候就需要注意一下父挂载点是否和其他挂载点有 peer group 关系,如果有且父挂载点是 shared ,就说明你挂载的设备除了在当前挂载点可以看到,在父挂载点的 peer group 的下面也可以看到。

参考

Linux mount (第二部分)